Rによるデータ分析

Rによるダミー変換

量的データを質的にデータにしたり、その逆の変換を知っていると、データ分析でできることが増えます。

ダミー変換

ダミー変換 をRで実行する時の実施例です。

Rによるデータ分析 では、 質的データを量的データに変換 するための標準的な前処理の方法として、入れていることが多いです。

この例では、Cドライブの「Rtest」というフォルダに、 「Data.csv」という名前でデータが入っている事を想定しています。 このコードの前に、ライブラリ「dummies」のインストールが必要です。

データは、質的データと量的データが混ざったものです。
Decision Tree

setwd("C:/Rtest") # 作業用ディレクトリを変更
library(fastDummies)
# ライブラリを読み込み
Data <- read.csv("Data.csv", header=T)
# データを読み込み
Data_dmy <- dummy_cols(Data,remove_first_dummy = FALSE,remove_selected_columns = TRUE)
# ダミー変換
write.csv(Data_dmy, file = "Output.csv")
# データをcsvファイルに出力

Decision Tree



参考文献

ダミー変換

かわみのblog
上記で使っているパッケージ以外も含む、ダミー変数を作ることができる4つのパッケージを紹介しています。 https://fuminorikawami.hatenablog.com/entry/2018/10/27/170129



Rによるデータ分析

データサイエンス教室